切成薄片的距离(SW)是一种计算有效的,理论上是Wasserstein距离的替代方案。然而,关于切片的分布,其统计特性(超出统一度量)的文献很少。为了为这一研究带来新的贡献,我们利用了Pac-bayesian理论和SW实际取决于切片分布依赖的Gibbs风险的中心观察,而Pac-Bayesian的数量范围已经设计为表征。我们提供四种类型的结果:i)在我们称为自适应切片的距离距离的豆豆泛化范围,即针对任何切片的分布定义的距离,ii)学习切片分布的过程最大歧视性的SW,通过优化我们的Pac-bayesian边界,iii)关于如何通过我们的理论来解释所谓的分布分布切片的距离,以及我们发现的经验例证。
translated by 谷歌翻译
切片 - Wasserstein距离(SW)越来越多地用于机器学习应用,作为Wassersein距离的替代方案,并提供了显着的计算和统计效益。由于它被定义为随机投影的期望,因此SW通常由Monte Carlo近似。我们通过利用测量现象的浓度来采用新的视角来近似SW:在温和的假设下,高维随机向量的一维突起大致高斯。基于此观察,我们为SW开发了一个简单的确定性近似。我们的方法不需要采样许多随机投影,因此与通常的Monte Carlo近似相比,准确且易于使用。我们派生了我们的方法的非对应保证,并且显示近似误差随着数据分布的弱依赖条件下的弱依赖条件而变为零。我们验证了对合成数据集的理论发现,并说明了在生成建模问题上提出的近似。
translated by 谷歌翻译
在包括生成建模的各种机器学习应用中的两个概率措施中,已经证明了切片分歧的想法是成功的,并且包括计算两种测量的一维随机投影之间的“基地分歧”的预期值。然而,这种技术的拓扑,统计和计算后果尚未完整地确定。在本文中,我们的目标是弥合这种差距并导出切片概率分歧的各种理论特性。首先,我们表明切片保留了公制公理和分歧的弱连续性,这意味着切片分歧将共享相似的拓扑性质。然后,我们在基本发散属于积分概率度量类别的情况下精确结果。另一方面,我们在轻度条件下建立了切片分歧的样本复杂性并不依赖于问题尺寸。我们终于将一般结果应用于几个基地分歧,并说明了我们对合成和实际数据实验的理论。
translated by 谷歌翻译
Before the transition of AVs to urban roads and subsequently unprecedented changes in traffic conditions, evaluation of transportation policies and futuristic road design related to pedestrian crossing behavior is of vital importance. Recent studies analyzed the non-causal impact of various variables on pedestrian waiting time in the presence of AVs. However, we mainly investigate the causal effect of traffic density on pedestrian waiting time. We develop a Double/Debiased Machine Learning (DML) model in which the impact of confounders variable influencing both a policy and an outcome of interest is addressed, resulting in unbiased policy evaluation. Furthermore, we try to analyze the effect of traffic density by developing a copula-based joint model of two main components of pedestrian crossing behavior, pedestrian stress level and waiting time. The copula approach has been widely used in the literature, for addressing self-selection problems, which can be classified as a causality analysis in travel behavior modeling. The results obtained from copula approach and DML are compared based on the effect of traffic density. In DML model structure, the standard error term of density parameter is lower than copula approach and the confidence interval is considerably more reliable. In addition, despite the similar sign of effect, the copula approach estimates the effect of traffic density lower than DML, due to the spurious effect of confounders. In short, the DML model structure can flexibly adjust the impact of confounders by using machine learning algorithms and is more reliable for planning future policies.
translated by 谷歌翻译
在本文中,我们旨在估算手头数据的真实分布下的机器学习模型的预测错误。我们将预测模型视为数据驱动的黑框函数,并使用非参数方法量化其统计属性。我们提出了一种新型的抽样技术,该技术利用了数据中嵌入的潜在概率分布信息。提出的方法结合了两个现有的框架来估计预测不准确误差。 $ n $ bootstapping和迭代式hoottrapping中的$ m $。 $ n $ bootstapping的$ m $是维持一致性,并且迭代式引导程序通常用于对预测误差估计的偏置校正。使用Monte-Carlo不确定性量化技术,我们将估算器的总方差分解,以便用户可以就克服可预防错误的措施做出明智的决定。另外,通过相同的蒙特卡洛框架,我们提供了一种通过经验分布而估计偏差的方法。这种偏见捕获了估计器对手动输入数据的敏感性,并有助于理解估计器的鲁棒性。在模型选择案例研究中使用模拟和实际数据集测试了提出的不确定性定量的应用。我们评估了两个框架中提出的估计器的性能;首先,直接应用是作为优化模型找到最佳模型。其次,固定优化引擎并将提出的估计器用作优化器的健身函数。此外,我们将提出的估计量的有限数据集与现有的最新方法比较了渐近统计属性和数值结果。
translated by 谷歌翻译
选择性分类是拒绝模型将通过输入空间覆盖范围和模型准确性之间的权衡进行不正确预测的输入的任务。选择性分类的当前方法对模型架构或损耗函数施加约束;这在实践中抑制了它们的用法。与先前的工作相反,我们表明,只能通过研究模型的(离散)训练动力来实现最新的选择性分类性能。我们提出了一个通用框架,该框架对于给定的测试输入,监视指标,该指标与训练过程中获得的中间模型相对于最终预测标签的分歧;然后,我们拒绝在培训后期阶段表现出太多分歧的数据点。特别是,我们实例化了一种方法,该方法可以跟踪何时预测训练期间的标签停止与最终预测标签的意见。我们的实验评估表明,我们的方法在典型的选择性分类基准上实现了最先进的准确性/覆盖范围。
translated by 谷歌翻译
尽管最近在不同的应用程序方案中广泛部署了3D点云分类,但它仍然非常容易受到对抗攻击的影响。面对对抗性攻击,这增加了对3D模型的强大训练的重要性。基于我们对现有对抗性攻击的性能的分析,在输入数据的中和高频组件中发现了更多的对抗性扰动。因此,通过抑制训练阶段的高频含量,改善了针对对抗性示例的模型。实验表明,提出的防御方法降低了对PointNet,PointNet ++和DGCNN模型的六次攻击的成功率。特别是,与最先进的方法相比,Drop100攻击的平均分类精度在Drop100攻击中平均提高3.8%,而Drop200攻击的平均分类精度提高了3.8%。与其他可用方法相比,该方法还提高了原始数据集的模型精度。
translated by 谷歌翻译
在本文中,我们研究了多视图几何中基本和基本矩阵估计的5-和7点问题的数值不太稳定性。在这两种情况下,我们表征了末极估计的条件号是无限的呈现不良世界场景。我们还以给定的图像数据表征不良实例。为了达到这些结果,我们提出了一般的框架,用于分析基于Riemannian歧管的多视图几何体中最小问题的调理。综合性和现实世界数据的实验然后揭示了一个引人注目的结论:在结构 - 从 - 动作(SFM)中的随机样本共识(RANSAC)不仅用于过滤输出异常值,而且RANSAC还选择用于良好的良好的图像数据,足够分离我们的理论预测的不良座位。我们的研究结果表明,在未来的工作中,人们可以试图通过仅测试良好的图像数据来加速和增加Ransac的成功。
translated by 谷歌翻译
我们介绍了棕色行人内径数据集(BPOD),用于在头部安装的行人设置中基准测试视觉内径算法。在布朗大学校园的12个不同室内和户外地点使用同步全球和滚动快门立体声相机捕获此数据集。与现有数据集相比,BPOD包含更多图像模糊和自动旋转,这在行人内径术中很常见,但罕见的其他地方。地面真理轨迹是从沿行人路径放置的粘贴标记产生的,并且使用第三人称视频记录行人的位置。我们在BPOD上评估代表性直接,特征和基于学习的VO方法的性能。我们的结果表明,需要显着的发展来成功捕获行人轨迹。数据集的链接在这里:\ url {https://doi.org/10.26300/c1n7-7p93
translated by 谷歌翻译
多项式方程系统经常在计算机视觉中产生,特别是在多视图几何问题中。用于解决这些系统的传统方法通常旨在消除变量达到单变量多项式,例如5点姿势估计的第十阶多项式,使用巧妙的操纵,或者更普遍使用Grobner基础,结果和消除模板,导致多视图几何和其他问题的成功算法。然而,当问题复杂时,这些方法不起作用,当他们这样做时,它们面临效率和稳定性问题。同型延续(HC)可以解决更复杂的问题而没有稳定性问题,并且保证全球解决方案,但已知它们是缓慢的。在本文中,我们表明HC可以在GPU上并行化,在多项式基准测试中显示出高达26倍的显着加速。我们还表明,GPU-HC可以在一系列计算机视觉问题上应用于一系列计算机视觉问题,包括具有未知焦距的4视图三角测量和三焦点姿态估计,其无法用消除模板解决,但它们可以用HC有效地解决它们。 GPU-HC打开门,以轻松配方和解决一系列计算机视觉问题。
translated by 谷歌翻译